# 读取数据
import pandas as pd
data = pd.read_excel('图书数据.xlsx', sheet_name=0)
print(data)

# 删除HTML标签
data['书名'] = data['书名'].str.replace(pat='<.*?>', repl='', regex=True)
print(data)

# 删除空格等字符
data['出版时间'] = data['出版时间'].str.replace(pat='/', repl='', regex=False)
data['出版时间'] = data['出版时间'].str.strip()
print(data)
